Gestion D'hypothhses Pour La Reconnaissance Structurelle De Documents Hypothesis Management for Structured Document Recognition

نویسندگان

  • Yannick Chenevoy
  • Abdel Belaïd
چکیده

RRsumm : Cet article ddcrit une approche originale pour identiier la structure spciique d'un document partir d'un moddle ggnnrique, dans un systtme base de blackboard appell graphein. Le systtme peut traiter diiirentes hypothhses de structuration et sa mmthodologie permet de prendre en compte le contexte structurel des documents. Le moddle est ddcrit l'aide d'un formalisme standard international (oda) qui caracttrise le contenu des diiirents objects et leurs subordinations. Le systtme adopte diiirentes strattgies de lecture l'aide des hypothhses extraites du moddle. Une mmthode descendante (guidde par le moddle) est appliquue lorsqu'une hypothhse est suusamment ssre, une mmthode mixte extrait d'abord des indices sur l'image avant de choisir une hypothhse, ou une mmthode entiirement ascendante (fusion) est active lorsque le moddle n'est pas directement utilisable. Le choix de la meilleure strattgie ddpend de l'analyse des hypothhses courantes. Abstract : This paper describes a new approach to identify the speciic structure of a document from a generic model by a blackboard based system called Graphein. The system deals with diierent hypotheses of structuration and its methodology permits to take into account the structural context of documents. The model is described with an international standard 1 formalism (oda) which characterizes the diierent constituent objects and their subordinates. The system adopts diierent reading strategies according to the hypotheses extracted from the model. A top-down method (guided by the model) is applied when an hypothesis is sure enoughh, a mixed method extracts clues from the image before applying one hypothesis, or a full bottom-up method (fusion process) is activated when the model is not directly usable. The choice of the best strategy to apply depends on the analysis of the current hypotheses.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Une approche multivue pour la gestion des documents multistructurés

RÉSUMÉ. La gestion flexible des documents numériques se situe aujourd’hui au centre des préoccupations des décideurs (production collaborative, partage, personnalisation, actualisation, agrégation, etc.). Il est évident ainsi qu’un même document peut avoir plusieurs descriptions et donc plusieurs décompositions et plusieurs structures selon plusieurs contextes. Il apparaît que la gestion de cet...

متن کامل

L'architecture CoMED pour la gestion collective de documents électroniques dans l'organisation

À l’heure actuelle, de nombreuses organisations souffrent d’une overdose informationnelle : les individus accèdent et conservent quotidiennement une quantité croissante de documents électroniques. De plus, les efforts individuels de recherche mis en œuvre ne sont pas rentabilisés et valorisés par une diffusion adaptée. Pourtant, la gestion rationnelle des documents est une condition nécessaire ...

متن کامل

Un modèle neuro markovien profond pour l'extraction de séquences dans des documents manuscrits

RÉSUMÉ. Dans cet article, nous proposons un système d’extraction de mots clés dans des documents manuscrits. Notre approche est basée sur la reconnaissance des lignes de texte à l’aide d’un modèle HMM capable de rejeter les mots n’appartenant pas à un lexique prédéfini. Afin d’être plus discriminant, nous avons remplacé les mélanges de gaussiennes des HMM par un réseau de neurones profond pour ...

متن کامل

Vers de nouvelles approches discriminantes pour la reconnaissance automatique de visages. (Towards new discriminant approaches for automatic face recognition)

HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau...

متن کامل

Une approche autonome pour la gestion logicielle des espaces intelligents. (An autonomic approach for the software management of smart spaces)

HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 1991